Národní úložiště šedé literatury Nalezeno 74 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Implementace dolovacích modulů systému pro dolování z dat na platformě NetBeans
Stríž, Rostislav ; Bartík, Vladimír (oponent) ; Šebek, Michal (vedoucí práce)
Sběr a ukládání dat hraje významnou roli v mnoha aspektech dnešního podnikání a kvalitní informace se stávají klíčem k úspěchu. Proces získávání znalostí z databází umožňuje z uložených dat získat skryté informace, které lze využít k dalšímu rozvoji. Tato práce se zabývá rozšířením nástroje, který slouží právě k dolování informací. Cílem bylo vytvořit modul pro dolovací program, pracující na platformě NetBeans avyvíjený na FIT ke studijním účelům. Nový modul bude umožňovat dolování z databázového systému Oracle pomocí netradičního použití genetického algoritmu. Obsahem práce je postup tvorby tohoto modulu - od teoretických základů až po podrobnosti implementace, testování a zhodnocení.
Multi-label klasifikace textových dokumentů
Průša, Petr ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování.
Classification on unbalanced data
Hlosta, Martin ; Popelínský, Lubomír (oponent) ; Štěpánková,, Olga (oponent) ; Zendulka, Jaroslav (vedoucí práce)
This thesis is focused on classification on unbalanced data. It is an important part of machine learning with the objective to address the issues when one class is significantly underrepresented compared to the other one. The minority class is usually more important, and the traditional algorithms favouring the majority class may ignore the importance of the minority class. Two application domains motivated the research and identification of two specific problems of the imbalanced data.  First, the presence of a constraint on the performance of a minority class in the computer security domain resulted in the formulation of the constrained classification problem. I proposed a solution that combines the cost-sensitive logistic regression and stochastic algorithms, which in the conducted experiments always improved the performance of the logistic regression.The domain of Learning Analytics motivated me to define a general prediction problem, whether a goal is has been achieved within the deadline. I designed the Self-Learning framework, in which models are trained by analysing attributes of objects that achieved the goal early in the investigated period. Because only a few objects satisfy the goal at the beginning, the problem is by its nature imbalanced, with the imbalance decreasing in time. The evaluation, performed on the task of identification of at-risk students in the distance higher education, showed (1) the predictive power compared the specified baseline models and (2) that methods for tackling the class imbalance without domain information didn't lead to significant improvements. When the domain information is utilised in the extended version of Self-Learning, the evaluation showed the performance increase.  Understanding and exploiting the source of imbalance can also lead to better results.
Modul víceúrovňových asociačních pravidel systému pro dolování z dat
Pospíšil, Jan ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Tato práce se věnuje problematice vytvoření dolovacího modulu pro dolování víceúrovňových asociačních pravidel pro již exitující dolovací systém. V úvodní části je obecně rozebraná problematika dolování z dat a dolovací algoritmy Apriori a ML T2L1. V hlavní části se práce věnuje návrhu a implementaci dolovacího modulu a DMSL elementů. V závěrečné části najdeme ukázkovou dolovací úlohu, porovnání jejich výsledků a celkové zhodnocení dosažených výsledků.
Využití metod dolování dat pro analýzu sociálních sítí
Novosad, Andrej ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Práce se zabývá problematikou dolování dat v prostředí sociálních sítí. Podává přehled o dolování z dat a možných metodách dolování. Práce také zkoumá sociální média a sítě, co mohou poskytnout a jaké problémy se sebou přinášejí. Jsou prozkoumané API třech sociálních sítí a jejich možnosti z hlediska získání dat vhodných pro dolování. Zkoumají se techniky dolování znalostí z textových dat. Je popsán způsob implementace webové aplikace, která doluje data ze sociální sítě Twitter pomoci algoritmu SVM. Implementovaná aplikace klasifikuje zprávy na základě jejich textu do tříd reprezentujících kontinenty původu. Je provedeno několik experimentů v softwaru RapidMiner a v implementované webové aplikaci a jejich výsledky jsou prozkoumány.
Analýza a monitorování obchodních procesů
Procházková, Martina ; Zámečníková, Eva (oponent) ; Pospíšil, Milan (vedoucí práce)
Práce se zabývá dolováním z procesů, dolováním z dat obecně, metodami pro klasifikaci a predikci, managmentem podnikových procesů a simulací. Obsahuje také program na vytváření simulačních dat a testování metod pro dolování z procesů.
Application of Genetic Algorithms and Data Mining in Noise-based Testing of Concurrent Software
Šimková, Hana ; Kofroň, Jan (oponent) ; Lourenco, Joao (oponent) ; Vojnar, Tomáš (vedoucí práce)
This thesis proposes an improvement of the efficiency of testing concurrent software by employing data mining techniques and genetic algorithms in the process of testing concurrent software. Concurrent, or multi-threaded, programming has become very popular over the last few years. However, as the concurrent programming is far more demanding the sequential programming, its increased use leads to a significant increase in the number of errors that appear in commercial software due to errors in synchronization. Finding such errors using traditional testing methods is difficult. Moreover, repeated test executions of traditional testing that are performed in the same environment will typically examine similar interleavings only. Hence, the noise-based injection approach is used for influencing the scheduling by injecting various kinds of noise (delays, context switches, and so on) into the common thread behaviour which stress the software and can to show some rare behaviour. However, for the noise injection to be efficient, one has to choose suitable noise injection heuristics from among the many existing ones as well as to suitably choose values of their various parameters, which is not easy. In this work, there are used data mining methods and genetic algorithms and their combinations to deal with the problem of choosing such noise injection heuristics and values of their parameters.  Besides setting up of the goals of the thesis, this proposal also provides a brief summary of the state of the art in application of data mining techniques and genetic algorithms to program testing problems.
Databázová nezávislost jádra systému pro dolování z dat FIT-Miner
Novák, Ondřej ; Šebek, Michal (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Systém pro dolování z dat FIT-Miner je nyní závislý pouze na jednom specifickém SŘBD. Tato diplomová práce se zabývá analýzou implementace pracující s databází, jednotlivých modulů a operacemi pro dolování z dat. Poté návrhem změn systému FIT-Miner tak, aby byl schopen pracovat s více SŘBD. A nakonec popisem implementace těchto změn.
Metody sumarizace dokumentů na webu
Belica, Michal ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Práce se zabývá sumarizací dokumentů ve formátu HTML. Jako jazyk webových dokumentů byla zvolena čeština. Práce je zaměřená na algoritmy sumarizace textů. Součástí práce je však i předzpracování sumarizovaného dokumentu a převod textu na reprezentaci vhodnou pro sumarizační algoritmy. Práce krátce pojednává o všeobecném dolování textů a později se zaměřuje na sumarizaci. Představené jsou dva jednoduché sumarizační algoritmy, přičemž práce se zaměřuje na pokročilý algoritmus využívající latentní sémantické analýzy. Výsledkem práce je návrh a implementace sumarizačního modulu pro jazyk Python. Souhrny generované implementovanými sumarizačními metodami jsou v závěrečné kapitole porovnány pomocí evaluačních metod i z pohledu subjektivního hodnocení autora práce.
Implementace algoritmů založených na rozhodovacích stromech v jazyce C#
Grolig, Lukáš ; Pešek, Martin (oponent) ; Stríž, Rostislav (vedoucí práce)
Tato bakalářská práce se zabývá výběrem dolovacích algoritmů pro klasifikaci založených na rozhodovacích stromech pro analytický systém vyvíjený v rámci projektu Systém pro zvýšení bezpečnosti v prostředí Internetu analýzou šíření škodlivého kódu. U vybraných algoritmů je popsána jejich implementace v jazyce C#. Implementované algoritmy jsou následně testovány z hlediska rychlosti učení algoritmu a přesnosti klasifikace. Na základě výsledků experimentů jsou sepsány závěry a dána doporučení pro uživatele těchto algoritmů.

Národní úložiště šedé literatury : Nalezeno 74 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.